﻿##실행을 위해서는 BeautifulSoap 설치가 필요하다.
##4.2버전으로 실행했으며, 실행방법은 압축을 푼 디렉토리에서
##setup.py build
##setup.py install
##을 차례로 실행하면 된다.

import urllib
from bs4 import BeautifulSoup

def CollectData( count ):
    result = []
    url = 'http://lotto.mygo.co.kr/map/index.php?cmd=round&round='+str(count)
    html = urllib.urlopen(url)
    data = BeautifulSoup(html)

    # 아래는 웹페이지 소스를 보고 파싱루틴을 적당히 구성한 것    
    data = data.findAll('tr', attrs={'align':'center'})
    if data==[]: return result
    data = data[1].findAll('td')
    if data==[]: return result
    for i in range(3,10):
        ttt = data[i].text.encode('ascii','ignore') # 유니코드 문자열을 아스키로
        result.append(ttt)
    return result


f = open('data.txt','w')

i=1
while(True):
    data = CollectData( i )
    if data==[]:
        break
    s = str(i)+','+reduce( lambda x,y:x+','+y, data )
    f.write(s+'\n')

    print s
    i+=1

print 'done'
f.close()



